#本题为transformer中多头注意力机制的实现,华为0928机考